Protein

Browse of TCMCG075C03333 protein

CDS


Accession Number	TCMCG075C03333
gbkey	CDS
Protein Id	XP_017983072.1
Location	complement(join(31901415..31901665,31902176..31902305,31902564..31902663,31902755..31902834,31903167..31903304,31903378..31903667,31903938..31904100,31904520..31904621,31904727..31904929,31905003..31905181,31905295..31905386,31905627..31905756,31905836..31906383,31906569..31906763,31907211..31907294,31907421..31907489,31907681..31907755,31907833..31907886,31907968..31908073,31908386..31908482,31908852..31909716))
Gene	LOC18613685
GeneID	18613685
Organism	Theobroma cacao

Protein


Length	1316aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA341501
db_source	XM_018127583.1
Definition	PREDICTED: DNA mismatch repair protein MSH6 [Theobroma cacao]

EGGNOG-MAPPER Annotation


COG_category	L
Description	Component of the post-replicative DNA mismatch repair system (MMR)
KEGG_TC	-
KEGG_Module	M00295 [VIEW IN KEGG]
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko00001 [VIEW IN KEGG] ko00002 [VIEW IN KEGG] ko03400 [VIEW IN KEGG]
KEGG_ko	ko:K08737 [VIEW IN KEGG]
EC	-
KEGG_Pathway	ko01524 [VIEW IN KEGG] ko03430 [VIEW IN KEGG] ko05200 [VIEW IN KEGG] ko05210 [VIEW IN KEGG] map01524 [VIEW IN KEGG] map03430 [VIEW IN KEGG] map05200 [VIEW IN KEGG] map05210 [VIEW IN KEGG]
GOs	GO:0000217 [VIEW IN EMBL-EBI] GO:0000404 [VIEW IN EMBL-EBI] GO:0003674 [VIEW IN EMBL-EBI] GO:0003676 [VIEW IN EMBL-EBI] GO:0003677 [VIEW IN EMBL-EBI] GO:0003684 [VIEW IN EMBL-EBI] GO:0003690 [VIEW IN EMBL-EBI] GO:0003824 [VIEW IN EMBL-EBI] GO:0005488 [VIEW IN EMBL-EBI] GO:0005575 [VIEW IN EMBL-EBI] GO:0005622 [VIEW IN EMBL-EBI] GO:0005623 [VIEW IN EMBL-EBI] GO:0006139 [VIEW IN EMBL-EBI] GO:0006259 [VIEW IN EMBL-EBI] GO:0006281 [VIEW IN EMBL-EBI] GO:0006290 [VIEW IN EMBL-EBI] GO:0006298 [VIEW IN EMBL-EBI] GO:0006725 [VIEW IN EMBL-EBI] GO:0006807 [VIEW IN EMBL-EBI] GO:0006950 [VIEW IN EMBL-EBI] GO:0006974 [VIEW IN EMBL-EBI] GO:0006996 [VIEW IN EMBL-EBI] GO:0008094 [VIEW IN EMBL-EBI] GO:0008150 [VIEW IN EMBL-EBI] GO:0008152 [VIEW IN EMBL-EBI] GO:0009987 [VIEW IN EMBL-EBI] GO:0016043 [VIEW IN EMBL-EBI] GO:0016462 [VIEW IN EMBL-EBI] GO:0016787 [VIEW IN EMBL-EBI] GO:0016817 [VIEW IN EMBL-EBI] GO:0016818 [VIEW IN EMBL-EBI] GO:0016887 [VIEW IN EMBL-EBI] GO:0017111 [VIEW IN EMBL-EBI] GO:0030983 [VIEW IN EMBL-EBI] GO:0032135 [VIEW IN EMBL-EBI] GO:0032300 [VIEW IN EMBL-EBI] GO:0032991 [VIEW IN EMBL-EBI] GO:0033554 [VIEW IN EMBL-EBI] GO:0034641 [VIEW IN EMBL-EBI] GO:0042623 [VIEW IN EMBL-EBI] GO:0043170 [VIEW IN EMBL-EBI] GO:0043570 [VIEW IN EMBL-EBI] GO:0044237 [VIEW IN EMBL-EBI] GO:0044238 [VIEW IN EMBL-EBI] GO:0044260 [VIEW IN EMBL-EBI] GO:0044424 [VIEW IN EMBL-EBI] GO:0044464 [VIEW IN EMBL-EBI] GO:0046483 [VIEW IN EMBL-EBI] GO:0050896 [VIEW IN EMBL-EBI] GO:0051276 [VIEW IN EMBL-EBI] GO:0051716 [VIEW IN EMBL-EBI] GO:0071704 [VIEW IN EMBL-EBI] GO:0071840 [VIEW IN EMBL-EBI] GO:0090304 [VIEW IN EMBL-EBI] GO:0097159 [VIEW IN EMBL-EBI] GO:1901360 [VIEW IN EMBL-EBI] GO:1901363 [VIEW IN EMBL-EBI] GO:1990391 [VIEW IN EMBL-EBI]

Sequence

CDS:
ATGGCATCATCGCGTCGGCAAAGCAACGGTAGATCACCTCTCGTTAATCAACAACGGCAGATTACTTCCTTCTTCTCTAAAACCAACTCACCTTCCCCTTCTCCTACTATCTCCAAACAGACCTCTAAACTCAACCCTAACTCTAAACCTAATCGGAGCCCAAGTAAAAGCCCAAGCCCCAGTCCGACCACTCCGTCCCCCGTTCAATCCAAGCTCAAAAAGCCCCTCCTAGTTATTGGCCAAACGCCCTCCCCGACTCCCTCGACGCCGGCCGACAAATCTTACGGCAAGGAGGTTGTTGATAAGAGGATTAGGGTTTACTGGCCGCTGGATAAGGCGTGGTACGAAGGTGTGGTGAAGTCTTTTGATAAGGAATCGGGTAAGCATTTGGTTCAGTATGATGATGCGGAGGAGGAGGAGTTGGATTTGGGGAAGGAGAAGATTGAGTGGATTAAAGAAAGCACGGGAAGGCTTAGGCGATTGCGGCGAGGGGGTTCTTCTTCGGTTTTTAAGAAGGTGGTGATTGATGATGAGGATGAGGGCGTGACAGAGAATGTGGAGCCAGAGAGTGATGATAATGATGATGATTCTAGTGATGAAGATTGGGGGAAGAATGTGGAGCAGGAAGTGAGTGAGGATGCCGAGGTGGAAGATATGGATTTGGAGGATGGGGAAGAGGAAGAAGAAGAAAATGAGGAGGAAATGAAAATATCGAAAAGAAAAAGCAGTGGAAAGACTGAAGCAAAGAAACGGAAGGCGAGTGGAGGAGGGAAATTGGAGTCTGGCAAAAAGAGTAAGACGAATGCAAATGTTAGTAAGCAAGAGCTTAAGGTGTCTTTGGTGGAACCTGTGAAGAAAATAGAAAGTGATAAGGCATCTAATGGTTTTGATAATGCTTTGGTGGGTGATGCATCAGAAAGGTTTGGTAAGCGTGAAGCAGAGAAGTTGCACTTCCTCACACCCAAGGAGCGTAGGGATGCAAATAGAAAACGTCCTGAAGATGTAAACTACAATCCAAAGACTTTATACTTGCCTCTTGATTTCTTGAAGAGCCTATCAGGTGGCCAGAGGCAATGGTGGGAGTTTAAGTCAAAGCATATGGACAAAGTTCTATTTTTCAAGATGGGTAAATTTTATGAACTTTTTGAAATGGATGCTCATATTGGGGCAAAAGAACTGGATTTGCAATATATGAAGGGGGAACAACCTCATTGTGGATTTCCAGAGAGGAACTTCTCTATGAATGTGGAGAAATTAGCTCGAAAGGGTTATCGAGTTCTTGTAGTAGAGCAAACTGAAACTCCTGAACAGCTGGAGCTTCGTCGGAAAGAGAAAGGTGCCAAGGATAAGGTTGTCAAACGTGAAATTTGTGCGGTGGTTACAAAAGGAACACTAACTGAGGGAGAGATGCTCTCAGCAAATCCTGACCCTTCTTACCTCATGGCAGTGACTGAATGCTGTCAAAGTTCAACAAACCAGAATGAGGATCGTATTTTTGGTGTGTGTGCCGTTGATGTTGCAACTAGCAGGATTATTCTTGGACAGTTTGGGGATGATTTTGAGTGCAGCGGATTGTGTAGTCTATTGGCTGAGTTGAGGCCAGTAGAAATTATAAAACCCACTAAACTGCTCAGTCTTGAAACTGAGAGGGCGATGTTGAGACATACAAGAAATCTCTTAGTGAATGAGTTGGTCCCATCTGCAGAATTCTGGGATGCGGGGAAAACTGTTTGTGAAGTTAAAAACATCTACAAGCGTATTAATGATCAATCAGCTGCTAGATCTGTTAATCATGTGGGTCCGAATGCTGCTAATTCTTGTGAGGGAGATGGGTCATGCTGCCTGCCAGCTATCCTTTCCAATCTACTGAGTGCTGGTGCGGATGGCAGCCTAGCACTCTCAGCTCTTGGAGGCACTCTTTATTACCTAAAACAGGCTTTTCTAGATGAGACATTACTTAGATTTGCGAAGTTTGAGTCACTTCCGTCCTCTGGTTTCAGTGGTATTGCTCAAAACCCCTACATGCTTCTTGATGCTGCTGCCCTGGAGAACCTTGAGATCTTTGAAAACAGCAGAAATGGAGACTCTTCTGGGACACTCTATGCACAATTGAATCACTGCGTGACAGCATTTGGGAAAAGGTTGCTAAAAACATGGCTTGCTAGACCATTATATCATGTGGATTTGATTAAGGAACGCCAAGATGCTGTAGCAGGCCTAAAGGGTGAAAATCTATCATATGCACTTGAATTTCGAAAGGCATTGTCCAGGCTTCCTGACATGGAGAGGTTGCTTGCACGTATCTTTGCTAGCAGTAAAGCTATTGGAAGAAATGCAAATAAAGTTATTTTATATGAAGATGCAGCAAAGAAGCAACTCCAGGAATTCATATCAGCTCTACGTTGTTGTGAATTGATGGTTCAAGCATGTTCTTCCCTTGGTGTCATTTTAGAAAATTTGGAGTCTACTCAGCTTCATCATTTGTTAACAGCTGGTAAAGGTCTTCCCAATATCCATTCAATTCTTAAGCATTTCAAGGATGCCTTTGATTGGGTTGATGCCAACAATTCTGGACGTATAATACCTCATGAAGGAGTTGATATGGAGTATGACTCTGCATGTGAAAGAGTTAAGGAGATCGAATCTAGTTTGACTAAGCACCTCAAGGAACAGCGCAAGTTACTTGGAGATTCATCAATCACCTACGTCACAGTTGGAAAAGATGTATATCTATTGGAAGTGCCAGAAAACTTGCGCGGAAGTGTCCCTCGGGATTATGAGTTACGTTCATCCAAAAAGGGTTTCTTCCGGTACTGGACTCAATATATCAAGAAGGTCATTGGAGAACTCTCACAAGCTGAATCTGAAAAGGAGATGGCTTTGAAGAACATTCTCCAGAGGTTAATCGGACAATTCTGTGAGGATCACAATAAATGGCGGCAGCTAGTTTCAACAACAGCAGAACTGGATGTACTGATCAGTCTAGCGATTGCAAGTGATTTTTATGAAGGGCCAACATGTCGTCCTCTTATCTTGGGCTCCTCATGTTCAAATGAAGTGCCATGCCTTTCTGCAAAAAGTTTAGGACATCCTATTCTCAGAAGTGATTCTTTAGGCAACGGTGCATTTGTCCCCAATGACATTACTATTGGGGGCTCTGGTCATGCAAGTTTTATCCTTCTTACTGGCCCTAATATGGGTGGAAAGTCTACACTTCTTCGCCAAGTTTGCTTGGCTGTGATTTTGGCCCAGGTAGGAGCCGATGTCCCTGCAGAACATTTCAAACTATCTCCTGTTGATCGAATCTTTGTCCGGATGGGTGCCAAAGATCATATTATGGCGGGACAGAGTACATTTTTAACAGAGCTTTCAGAAACTGCATTAATGCTGTCTTCAGCAACTCAACATTCACTTGTGGCATTGGATGAACTTGGACGTGGAACATCAACTTCTGATGGACAAGCCATTGCAGAATCAGTTCTTGAACATTTTGTACACAAGGTGCAGTGTCGAGGAATGTTTTCAACACACTATCACCGTTTGGCTGTGGACTATGAAAACAATTCCAAGGTCTCTCTCTGCCATATGGCATGCCAAGTTGGAAATGGAGTTGCAGGTGTGGAAGAAGTTACATTTCTTTACAGGTTGACCACTGGAGCCTGTCCAAAAAGCTATGGGGTGAATGTTGCACGACTAGCTGGGCTTCCGGACTCAGTACTACTGACAGCTGCTGCTAAGTCTAGAGAATTTGAGTCTGCGTATGGGAAACACAGAAAGGGATCTGAAGACGACTTGCCAATGCAAAGTTGTGCAGATAAGATGGTAGCTTTTATTCGAGAATTGATCAGCCTTACAGCAAATGCAAATTGCTTAAACACTTACGAGGATAGTTGTATCAACTCCTTGACCGAACTTCAACATAGGGCAAGGATACTTCTGCAGCAACATTAA

Protein:
MASSRRQSNGRSPLVNQQRQITSFFSKTNSPSPSPTISKQTSKLNPNSKPNRSPSKSPSPSPTTPSPVQSKLKKPLLVIGQTPSPTPSTPADKSYGKEVVDKRIRVYWPLDKAWYEGVVKSFDKESGKHLVQYDDAEEEELDLGKEKIEWIKESTGRLRRLRRGGSSSVFKKVVIDDEDEGVTENVEPESDDNDDDSSDEDWGKNVEQEVSEDAEVEDMDLEDGEEEEEENEEEMKISKRKSSGKTEAKKRKASGGGKLESGKKSKTNANVSKQELKVSLVEPVKKIESDKASNGFDNALVGDASERFGKREAEKLHFLTPKERRDANRKRPEDVNYNPKTLYLPLDFLKSLSGGQRQWWEFKSKHMDKVLFFKMGKFYELFEMDAHIGAKELDLQYMKGEQPHCGFPERNFSMNVEKLARKGYRVLVVEQTETPEQLELRRKEKGAKDKVVKREICAVVTKGTLTEGEMLSANPDPSYLMAVTECCQSSTNQNEDRIFGVCAVDVATSRIILGQFGDDFECSGLCSLLAELRPVEIIKPTKLLSLETERAMLRHTRNLLVNELVPSAEFWDAGKTVCEVKNIYKRINDQSAARSVNHVGPNAANSCEGDGSCCLPAILSNLLSAGADGSLALSALGGTLYYLKQAFLDETLLRFAKFESLPSSGFSGIAQNPYMLLDAAALENLEIFENSRNGDSSGTLYAQLNHCVTAFGKRLLKTWLARPLYHVDLIKERQDAVAGLKGENLSYALEFRKALSRLPDMERLLARIFASSKAIGRNANKVILYEDAAKKQLQEFISALRCCELMVQACSSLGVILENLESTQLHHLLTAGKGLPNIHSILKHFKDAFDWVDANNSGRIIPHEGVDMEYDSACERVKEIESSLTKHLKEQRKLLGDSSITYVTVGKDVYLLEVPENLRGSVPRDYELRSSKKGFFRYWTQYIKKVIGELSQAESEKEMALKNILQRLIGQFCEDHNKWRQLVSTTAELDVLISLAIASDFYEGPTCRPLILGSSCSNEVPCLSAKSLGHPILRSDSLGNGAFVPNDITIGGSGHASFILLTGPNMGGKSTLLRQVCLAVILAQVGADVPAEHFKLSPVDRIFVRMGAKDHIMAGQSTFLTELSETALMLSSATQHSLVALDELGRGTSTSDGQAIAESVLEHFVHKVQCRGMFSTHYHRLAVDYENNSKVSLCHMACQVGNGVAGVEEVTFLYRLTTGACPKSYGVNVARLAGLPDSVLLTAAAKSREFESAYGKHRKGSEDDLPMQSCADKMVAFIRELISLTANANCLNTYEDSCINSLTELQHRARILLQQH

Browse of TCMCG075C03333 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence